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KORTE S AMEN VAT T IN G 


Er wordt een optisch tekenlees sy steem behandeld voor gestyleerde 
cijfers en enige speciale symbolen, heCOCR A n cijfer type. 

Er wordt ingegaan op de principes van herkenning, waarbij vooral 
aandacht wordt geschonken aan afwijkingen in de gedrukte tekens. 

De logische organisatie van een herkenningsschakeling op basis 
van een kolomsgewijze aftasting van het teken wordt beschreven. 
Tenslotte» wordt in een bijlage een kwalitatieve toets afgeleid om het 
onderscheidingsvermogen van diverse methoden te vergelijken. Deze 
toets kan tevens gebruikt worden om een zinvolle redundance reduktie 
te bereiken. 
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l.INLEIDING 

Onder een tekenleesmachine wordt hier een machine verstaan,die ge- 
drukte tekens leest waaraan de meiis dezelfde betekenis toekent als 
de machine - Deze definitie sluit ponskaartlezer s en machines die 
potloodstrepen waar kunnen nemen, uit ( zie lit. opgave 2). 

Het in vergelijking met de mens zeer weinig gedifferentieerde her- 
kenningsvermogen van de leesmachine maakt een zinvolle toepassing 
slechts dan mogelijk wanneer vergaande beperkingen met betrekking 
tot blikveld, cijfertype en drukkwaliteit mogelijk zijn. Aan de andere 
kant dienen de voordelen van een machine t. o. v. de mens, zoals snel- 
heid, onvermoeibaarheid en betrouwbaarheid ten voile benut te kunnen 
worden. 

De meeste toepassing heeft de leesmachine tot nu toe gevonden in die 
bedrijven, waar voortdurend een groot aantal dokumenten wordt ver- 
werkt en waar op de te lezen informatie als een rij van cijfers op het 
dokument is gedrukt. Hiertoe neemt de machine de dokumenten 44n voor 
44n van een stapel en voert ze langs de leeskop. De voortbeweging onder 
de leeskop geschiedt parallel aan de te lezen rij van cijfers, zodat deze 
44n voor 44n gelezen kunnen worden. Eventueel worden de dokumenten 
op grond van het gelezenegesorteerd. Ook is het mogelijk een rekenautom; 
aan de leesmachine te koppelen om de opgenomen informatie direkt te 
verwerken. 

De gelezen tekens kunnen ook worden opgenomen in een geheugen in de 
vorm van een magnetische band, geponste papierstrook, ponskaart enz. 

De snelheid van de leesmachine wordt hoofdzakelijk door de transport- 
inrichting bepaald. Een aantal van 30 dokumenten per seconde is ongeveer 
het huidige maximum, dat vele malen boven het door de mens bereikbare 
ligt. Op het dokument kunnen 10 cijfers per inch gedrukt staan; op een 
chfeque van 15 cm lengte kunnen tot 50 tekens voorkomen per regel, die 
alle gelezen moeten worden, De leesmachine zal dus tenminste 1500 teker 
per sekonde moeten kunnen lezen. 

Het is een nog niet besliste strijdvraag of een leesmachine lang^optische 
of magnetische weg dient te lezen. In een optische leesmachine wordt er 
een lichtbundel op het teken gericht. Het teruggekaatste licht is door het 
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teken gemoduleerd, daar bedrukt papier minder reflecteert dan wit papier. 
Indien de gebruikte inkt gemagnetiseerd is, zal in een spoeltje van een 
leeskop dat zich dicht bij het bedrukte papier bevindt, een inductiestroom 
worden opgewekt. Uit de variatie van deze stroom in de tijd kan het teken 
afgeleid worden. Als voordeel van magnetisch lezen ten opzichte van optisc 
lezen mag de geringe gevoeligheid voor vervuilingen, stempels, enz, gelde 
Nadelig is het dat er slechts dure, eenmalige inktlinten gebruikt kunnen 
worden in de druk-of schrijfmachine. Indien men een kasregisterrol wil 
lezen, is een optische ieesmachine het aangesrezen apparaat. 

2. Het "OCR A TT CIJFERTYPE 

Zijn gestyleerde gedrukte cijfers eenvoudiger te lezen dan handgeschreven 
cijfers, voor een Ieesmachine die betalingsformulieren moet lezen zijn 
ze absoluut noodzakelijk. Het percentage substitutes (verwisseling van de 
tekens) geeft direkt aan of de machine geschikt is voor het bankwezen. 

Het percentage substituties mag niet meer dan 66n op enkele honderdduizen 
tekens bedragen, terwijl niet meer dan 7 op de tienduizend tekens als on- 
leesbaar mag worden afgewezen. 

Door de International Standards Organisation is een gestyleerd cijfertvpe 
voorgesteld voter optische tekenherkenning, het "OCR A n cijfertype (OCR 
is de afkorting van Optical Character Recognition). De vorm der tekens 
is een compromis tussen estetisch voorkomen en leesbaarheid volgens 
diverse systemen. 

Ook is rekening gehouden met de nauwkeurigheid, die men van schrijf- 
machines, regeldrukkers e.a. kan eisen. Figuren 1 en 2 geven de tekens 
sterk vergroot weer, terwijl zij in figuur 3 op normale schaal zijn te zien. 
De nominale lijndikte is 0,35 mm, maximale breedte gemeten tussen de 
middellijnen der verticale strepen is 1.40 mm, terwijl de maximale hoogt< 
gemeten tussen de middellijnen der^horizontale strepen 2,39 mm is. 

Twee belangrijke toleranties zijn die betreffende de lijndikte en de afstand 
tussen de middellijnen der strepen. Dit is respectievelijk 0,20 mm en 0, 07 
mm. 

De verhouding tussen maximale en minimale streepdikte is 2, 5 . Deze ver- 
houding moet wel vrij groot gekozen worden, omdat de dikte van schrijf- 
machineschrift sterkt afhankelijk is van de ouderdom van het gebruikte 
inktlint. 
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De onderkant van het dokument wordt als referentielijn gebruikt. 

Ten opzichte van deze lijn mag een teken niet meer dan 3° afwijken 
van de verticale stand* De afstand van de onderzijde van het teken 
tot de referentielijn ligt niet vast, Het leessysteem zal in de meeste 
gevallen het teken moeten zoeken. 

3. HERKENNING 

De betekenis van een teken ligt vastgelegd in de karakteristieke kontrasten 
op het papier. De leesmachine neemt deze kontrasten waar en beslist welk 
teken is waargenomen, De leesmachine kan men daarom functioneel in 
twee onderdelen splitsen; 

1. De waarugmer Dit onderdeel zet de optische informatie om in b. v. 
elektrische. Deze elktrische informatie wordt door versterking geschik 
gemaakt voor: 

2. De beslisser . De beslisser onderzoekt het signaal afkomstig van de waa 
mer en beslist welk teken gelezen is. 

Als men een leesmachine met de mens wil vergelijken dan komt de 
waarnemer overeen met onze ogen en de beslisser met een gedeelte van 
onze hersenen, Andere delen van de hersenen vervullen de rol van de 
aangekoppelde rekenautomaat. 

Men kan de waarnemer en de beslisser niet geheel van elkaar gescheide 
denken. Een ideale waarnemer geeft alle informatie door aan de be¬ 
slisser, die relevant is, doch niets meer ( 3, 14) 

3.1 De waarnemer 

Voor de verwerkelijking van de waarnemer zijn diverse technieken 
ontwikkeld. In een onlangs verschenen nederlandse uitgave geeft Steinbu 
(12) een vrij uitgebreid overzicht. Het is opvallend dat technieken die op 
het eerste gezicht bijzonder aantrekkelijk zijn, in de praktijk zelden of 
niet worden toegepast. 
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Enige wel veel gebruikte methoden zijn 

1. flying spot scanner (bewegende lichtvlek aftaster) 

Op ££n paar afbuigplaten van een elektronenstraaloscilloscoop wordt 
een langzame zaagtandspanning gezet, op het andere paar een snelle 
zaagtandspanning. Hierdoor beweegt er een lichtvlek over het beeld. 

Dit licht wordt op het document geprojecteerd; het beeldvlak is juist 
zo groot, dat zich daar ££n teken kan bevinden. Het teruggekaatste 
( of doorgelaten) licht wordt via een lenzen stelsel naar een fotover- 
menigvuldiger geleid. De kontrastvariatie op het papier is zo omgezet 
in een stroomvariatie in de tijd. 

2. de "mechanical image dissector" kan men bezien als het mechanisch 
analogon van de flying spot scanner. Het licht valt op twee achter elkaa: 
aangebrachte draaiende schijven. 

De schijven zijn van sleuven voorzien , waar het licht doorheen kan 
schijnen. De ene schijf doet de lichtvlek vertikaal bewegen, de andere 
horizontaal. 

3. Een T. V. opneembuis. Indien men het videosignaal uitleest, verkrijj 
men een signaal dat overeenkomst vertoont met de signalen die bij (l) 
en (2) ontstaan. 

4. Een rij lichtgevoelige elementen. Door de beweging van het papier 
wordt al zorg gedragen voor een scheiding in horizontale zin. Een rij 
lichtgevoelige elementen vertikaal op de bewegingsrichting van het papii 
zorgt voor de vertikale scheiding. Ook hier nemen de lichtgevoelige 
cellen het gereflecteerde of doorgelaten licht waar. 

De techniek van flying spot scanner biedt het grote voordeel terugkoppe 
ling mogelijk te maken. Dit geschiedt door de spanningen op de afbuig¬ 
platen afhankelijk te maken van de bevindingen van de beslisser. Dit is 
vooral belangrijk indien het te lezen teken aan zeer grote variaties ond« 
hevig is, zoals bij het lezen van handschrift (l). De flying spot scanner 
heeft echter enkele nadelen, die hem ongeschikt maken voor het gebruil 
in een snelle lezer. Bij gebruik van een fosforlaag met korte nalichttijd 
is het opgewekte licht van lage golflengte (+ 400nm). In figuur 5 is te zj 
dat hierbij het vrijwel onmogelijk is onderscheid te maken tussen het 
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werkelijke teken en toevallige vervuilingen zoals stempels en ballpoint - 
strepen. Een fosforsoort die bruikbaar licht opwekt heeft daarentegen 
een nalichttijd van enkele honderden milliseconden. Dit stelt een grens 
aan de maximale aftastfrequentie en dus aan de leessnelheid. 

Met een vidiconbuis heeft men het bijzonder vervelende effekt van 
kontrastvermindering. Dit wordt veroorzaakt door weglekken van lading 
op de lichtgevoelige laag in de vidiconbuis, Verder mag het papier maar 
zeer kort belicht worden vanwege de traagheid van de buis. 

In het nu volgende wordt aangenomen dat er een rij van lichtgevoelige 
elementen ••gebruikt wardt. Als lichtgevoelige elementen worden silicium 
solarcellen gebruikt. Een solarcel zet lichtenergie om in elektrische 
energie. Het rendement van de omzetting is ten hoogste 15%. 

Dit is inherent verbonden met de werking, die simplistisch als volgt kan 
worden omschreven; een lichtkwant dringt het halfgeleidermateriaal binnen 
en maakt hierin elektronen vrij. Deze vrije elektronen bewegen zich voort 
tot zij recombineren met een vrij gat. Hieruit blijken direkt twee ding en. 
Ten eerste werkt een solarcel principieel als een stroombron en ten tweeds 
dient een lichtkwant een zeer bepaalde energie te bezitten. De celgevoelig- 
heid is dus sterk afhankelijk van de golfllengte: de grootste gevoeligheid 
ligt tussen de 800 en 1200 nm. Uit figuur 4 blijkt dat dit bereik ook gunstig 
om drukinkt te onderscheiden van storingen zoals stempels en ballpoint- 
strepen. (12). 

3.2 De beslisser 

Ook voor de beslisser heeft men vele verschillende oplossingen gevonden. 
Veelal beschouwt men de uitgang van de waarnemer als een vektor in een 
n-dimensionale ruimte. De dimensie wordt bij een vidiconbuis bepaald dooi 
de aftastfrequentie en bij een rij fotocellen door de aftastfrequentie en het 
aantal cellen. De beslisser is in staat van elke vektor te bepalen in welke 
deelverzameling van de mefetruimte deze valt. Het aantal deelverzamelinge 
is 66n groter dan het aantal ver schillende tekens dat herkend moet worden. 
De extra deelverzameling is die der nietherkende tekens. 

Alle deelverzamelingen zijn disjunkt en tesamen spannen zij de gehele 
ruimte op. Indien de omtrek van de deelverzamelingen niet vastligt, maar 
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zelfinstelbaar is, spreekt men van een kerende beslisser(l l) 
Tengevolge van ruis wordt eenzelfde teken op verschillende 
tijdstippen op ver schillende punt en in de meetruimte afgebeeld. 
Hierdoor kan een teken afgebeeld worden op een punt in de meet¬ 
ruimte dat binnen de grenzen van de deelverzameling van een ander 
teken valt. De beslisser maakt dan een niet te voorkomen fout. 

Er is een onzekerheid ten aanzien van de afbeelding van een teken en 
dus ook een onzekerheid ten aanzien van de beslissing. Vanwege dez« 
onzekerheid is het zinvol met waarschijnlijkheden te rekenen. 
Statistische beslissings funkties zijn voor de hand liggend. (5, 7, 8, 9, 
Voor een goede toepassing van deze methodieken is meestal een a pi 
kennis van de terzake doende waar schijnlijkheden noodzakelijk. Zijn 
niet bekend, dan neemt men ze als bekend aan en korrigeert de aangc 
waarden tijdens een leerproces. Een leer machine als de Perceptron 
(10, 11) is hier niet op zijn plaats. Een Perceptron kan namelijk alle< 
dan twee tekens leren onderscheiden, indien de betreffende verzame- 
lingen der punten in de meetruimte disjunkt zijn. 

Een veelbelovende methode om de beslisser uit te voeren, is de 
kenmerkherkenning . Deze methode is een combinatie van herkennin 
volgens zekerheden en herkenning volgens onzekerheden. 

Onder een kenmerk wordt dan verstaan een onveranderlijke, noodzaJ 
eigenschap van een teken. 

Zo is het een kenmerk van een " 9 M (Type M A M ) dat er zich uiterst r 
een lange verticale streep bevindt. 

De onzekerheid wordt teruggedrbngen van de beslissing over een tek 
naar de beslissing over een kenmerk. 

Dit wil niet zeggen dat de uiteindelijke beslissing nu gehee4 zonder 
kans of fouten is. 

Een kenmerk heeft een tweewaardig karakfer: 

Een teken heeft eenzeker kenmerk al of niet. 

Zijn de kenmerken van een teken bepaald, dan wordt het teken met 
een normale poortschakeling bepaald. Om m tekens te onderscheid* 
zijn minimaal 2 Eog m kenmerken nodig. 

De tekens hebben dan een Hammingafstand 1. (4) 
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Dit betekent dat de beslisser een substitutiefout zal maken indien 
kenmerk foutief bepaald wordt. Volgens (5) is de kans op een 
foutieve beslissing ongeveer omgekeerd exponent ieel evenredig 
met de minimale^Hammingaf stand der tekens. Bij het Class A 
cijfertype blijkt een afstand 2 de grootste minimumafstand te zijn, 
indien men als kenmerken de posities der horizontale en korte verti- 
kale strepen kiest. Frankel (5) is echter niet volledig : behalve de mini 
male afstand speelt ook de gemiddelde afstand een rol. Dit is 

als volgt op eenvoudige wijze in te zien. Stel dat men tien tekens wil 

10 9 

herkennen, die alle even frequent voorkomen. Men kan dan * 7 = 45 

2 

verschillende substituties maken. 


Neem vervolgens aan dat 66n paar tekens f de M 2 M en de 3 M een onder- 
linge afstand 2 bezit en alle andere paren tekens een onderlinge afstand 
3. De kans op een substitutie van de M 2 M voor de n 3 n of van de "3 M 
voor de "Z" zij 10 . De kans op een willekeurig andere substitutie is 


dan : 


(us ^ i) 


(zie bijlage 1) 

De kans op een substitutiefout wordt dus voor 3/5 door de 44 paren met 
onderlinge afstand 3 bepaald J 

Wat is het maximale aantal kenmerken, waarmee men de 13 tekens var 
Class A cijfertype kan beschrijven ? 

Als kenmerken worden de posities der horizontale en korte vertikale si 
pen genomen . Een korte vertikale streep kan zich op 10 ver schillende 
plaatsen bevinden: hoog of laag in het teken in 5 ver schillende kolommc 
Een horizontale streep kan zich in 3 posities bevinden: 
hoog-midden-laag. (De speciale posities der horizontale middenstrepe 
in de r, 6 ,f en de n 9 M mogen niet als speciale kenmerken worden gezieii 
Uit tolerantieoverwegingen is namelijk de hoogte der horizontale strep 
niet exact bepaald. De middenstreep van de M 6 M kan zo op dezelfde 
hoogte komen als bij de n 8” )* Concluderend kan men zeggen dat een 
teken van het Class A type door ten hoogste 13 kenmerken bepaald 
wordt* De kenmerken zullen als volgt aangegeven worden: 

A1 = korte verticale streep meest rechtse kolom boven 
A2 = korte verticale streep meest rechtse kolom onder 
El = korte verticale streep meest linkse kolom boven 
E2 = korte verticale streep meest linkse kolom onder 
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FI = horizontale streep boven 
F2 = horizontale streep midden 
F3 = horizontale streep onder 


Het cijfer "o" kan nu als volgt omschreven worden: 

0 - ai.ai .U.ci C2 .cJT. cJl ei e 2 . f ,. pi. f s 

In tabel I is de komplete waarheidstabel voor de 13 tekens opgenomen. 
Tabel II geeft de onderlinge afstand voor alle 78 mogelijke paren. 

Hieruit blijkt dat de minimumafstand 2 is en de gemiddelde afstand 4, 66. 
De gevonden gemiddelde afstand geeft echter een misleidend beeld. 

Er is bij het opstellen hiervan immers aangenomen dat de juiste verticale 
positie van het teken bekend is* In praktijk zal men in verticale richting 
naar het teken moeten zoeken. 

3. 3 VERTICALE PLAATSBEPALING 

De verticale positie van het teken kan eventueel met een vooronderzoek 
(pr^scanning ) gevonden worden. Het zal echter blijken dat een andere 
methode efficignter is* Hiertoe wordt aangenomen dat een rij van 10 foto* 
cellen juist het gehele teken in'verticale richting kan bedekken. Om enige 
speling toe te laten in de verticale positie van het teken zijn 25 fotocellen 
boven elkaar geplaatst. Het mechanisch transportgedeelte van de leesma* 
wordt z<5 uitgevoerd dat het teken van links naar rechts onder de rij foto¬ 
cellen doorschuift. Hierdoor wordt eerst kolom a waargenomen, vervolg- 
kolom b, enz. Het begin van een teken wordt waargenomen doordat ten 
minste drie naast elkaar gelegen cellen "zwart" waarnemen. Zodra dit 
wordt waargenomen wordt er gecentreerd op de positie van deze streep. 
Deze centrering geschiedt elektronisch, doch komt neer op het naar bene 
schuiven van het teken tot in de laagste drie boven elkaar gelegen rijen 
ean zwart veld gevonden wordt. 

Dit schuiven brengt in de meest rechtse kolom een laagliggende streep: e 
De positie van het teken in de meer naar links gelegen kolommen wordt 
nu gerelativeerd ten opzichte van deze streep. Het is duidelijk dat deze 
centrering geen verschuiving betekent voor die tekens die volgens tabel ] 
kenmerk a2 reeds vertonen. Dit zijn de tekens 0 # 1, 3, 4, 5, 6, 8, 9 ,H 

De tekens 2, 7, J* en V worden echter als het ware 4 tot 5 rijen naar benede 
geschoven. De korte verticale strepen hebben nu geen tien, maar vijftiei 
mogelijke posities gekregen. De 6 bijgekomen kenmerken zijn a3,b3,c3 
d3, e3, en f4. Door deze toename van kenmerken mag men een verbete 
van de gewogen gemiddelde afstand verwachten. De codering van het tek 
1 1 - j**»• «* r i Co c \ 




TABEL 1 

j * 

1 = kenmerk is aanw^zig 
0 = kenmerk is afw'e'zig 
- = don't care 









TABEL, II 



% * 
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enisnu: qi. qj. Qi. bi t>i bi. ci c.2. Ci. erf t. eft. ala . e i . e l ^ a. f r f 2 P *> f ^ 

De code ring van het taken 2, was: Q\ 01 . b 1 . Li , o, C2. di di. £1 ^ 2 . f \ -f. 

en is nu: al ar a~b . bi. br bi, ci. ci. cj. erf <. ai 2 ai^.ei fr.f 2 .fi. f > 

De onderlinge(niet gewogen) afstand tussen de M 0 M en de n 2 n was 
3 en is nu 7. In tabellen 3 en 4 zijn resp. de coderingen en de onder- 
linge afstanden gegeven. 

Deze redenering is niet geheel correct. De vergroting van sommige afstand* 
tussen de tekens wordt veroorzaakt door de verschuiving. De mate van 
verschuiving wordt bepaald door de plaats van de laagste verticale korte 
streep in de meest rechtse kolom. Een storing in het teken in deze kolom 
kan daardoor meerdere kenmerken tegelijk veranderen, Indien hiermee 
geen rekening wordt gehouden mag het resultaat slechts kwalitatief gebruikt 
worden, 

Een zinvolle definitie van afstand is er 66n die aangeeft hoeveel fouten gema 
kunnen worden v<5<5rdat een teken als een ander teken wordt waargenomen. > 
de verticale strepen in de meest rechtse kolom is echter geen konstante noi 
te vinden. Het wegvallen van een verticale streep in de eerste kolom is sorr 
minder erg dan dat er ten onrechte in de eerste kolom een extra streep ge- 
vonden wordt. 

Bekijkt men tabel 2 dan zijn er 8 paren met onderlinge afstand 2. 

Hiervan zijn er 3, die een schijnbare afstandsvergroting kunnen krijgen 
door een relatieve verschuiving. Voor de paren 0-6 en 3-5 is het gunstiger 
naar boven te schuiven en voor het paar 2-3 is het gunstiger naar beneden 
te schuiven. 

Behaive de tekens naar beneden te schuiven kan men ze 00k naar boven sch 
Dit schuiven brengt dan in de meest rechtse kolom (a) een hoog liggende str 
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'TABEL, III 

(naar beneden geschoven) 












TABEL IV 

(naar beneden geschoven) 
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De positie van de andere strepen in het teken wordt weer gerelativeerd 
ten opzichte van deze eerste Streep. Voor de tekens die volgens tabel I 
kenmerk al reeds vertonen, betekent dit geen verandering. Dit zijn de 
tekens 0, 2, 3, 4, 7, 9, J 1 ,V > en rl . De tekens 1, 5, 6 en 8 worden 
echter omhoog geschoven. Dit brengt weer een winst van 6 kenmerken : 
aQ, bQ, c q j d G , e G en io* 

In feite is er maar een winst van 5 kenmerken, omdat a Q nooit kan optredei 
Verder heeft kenmerk aj zijn informatieve waarde verloren, omdat elk 
teken nu dit kenmerk vertoont. 

Evenzo zal bij het naar beneden schuiven kenmerk a3 nooit an kenmerk a2 
altijd optreden. 

De resultaten van het naar boven schuiven zijn weergegeven in tabellen V e 
In tabel Vis a Q genoteerd als aj, a^ als a£ en a 2 als a^, enz. 

In bijlage I is een kwalitatieve methode ontwikkeld om te bepalen welke 
methode van schuiven de voorkeur verdient. Zijn de diverse konditionele 
waarschijnlijkheden van optreden bekend, dan khn de toets sis kwantitatief 
gebruikt worden. 

Uit de tabellen III en V blijkt dat raerfc alle kenmerken bijdragen tot het 
scheidend vermogen van het systeem. Het is niet zinvol kenmerken die all 
tekens gemeenschappelijk bezitten of niet bezitten te betrekken bij de 
herkenning^kenmerken waarmee men in staat is ten minste &6n teken van 
de andere te onderscheiden, worden zinvol genoemd. Volgens Tabel III 
(naar beneden geschoven)zijn er 13 zinvolle kenmerken. Wordt het teken 
naar boven geschoven, dan zijn er volgens Tabel V , 14 zinvolle kenmerl 

3. 4 SCHEEFSTAANDE TEKENS 

De tekens op een dokument staan niet zuiver loodrecht op de referentieliji 
de beneden rand van het dokument. Dit scheefstaan ontstaat door scheef 
inzetten en -afsnijden van het papier en door scheefstaande tekenarmen 
in een schrijfmachine of speling tussen de tekenschijven en de as in een 
regeldrukker* De International Standards Organisation heeft de maximale 
richtingsafwijking (skew) op 3° gesteld. Aan deze eis is met normale drul 
inrichtingen goed te voldoen. 

Een scheefstaande streep kan door de waarnemer als een bredere streep 
worden gezien: 
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TABEL V 

(naar boven geschoven) 
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TABEL VI 


(naar boven geschoven) 
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De breedte d2 wordt meestal niet waargenomen. Het begin van een streej 
wordt gesignaleerd door b. v. het waarnemen van x zwarte velden. 

Dan wordt een breedte d 3 waargenomen: 


d _ d _ "x . 5 s i n cx -+* (S-^c) Uin o< 

i ~ * 

- ol, 4 * ( ksln o 

5 

|d,-d i j IS als ^ = -2 ^ / 3 

Voor x = 3 is dj = 0/33 mm, 

De verandering in de streepbreedte t.g.v. scheefstaan is veel minder dan 
variatie die toegestaan is. Dit levert dus geen moeilijkheden. Door het 
scheefstaan van een teken wordt ook de hartlijn van een streep verplaatst. 
Voor strepen op gelijke hoogte is deze verplaatsing vrijwel hetzelfde, 
zodat de afstand der hartlijnen ongewijzigd blijft. Voor strepen op ongelijl 
hoogte is de verandering in de hartlijnafstand ten hoogste 0,035 mm en 
dus verwaarloosbaar gezien de toegelaten variatie in deze maat van 0, 075 
Een teken dat slechts 3° scheef staat levert omdeze redenen geen princip 
moeilijkheden op voor het leessysteem. 

In (6) wordt een her kenning smethodiek afgeleid die geen beperkingen opleg 
aan de eventuele afwijkingen in de verticale stand der tekens. 

3.5 V ERT I CAEE AFSTAND TUSSEN DE TEKENS 

Behalve de regel die het leessysteem moet waarnemen, kunnen nog ander« 
regels OCR A tekens op het dokument aangebracht zijn. De amerikaanse 
specificaties spreken van 6 regels per inch. Rekening houdend met de 
maximale streepdikte komt dit neer op een gemiddelde verticale afstand 
van 2,2 mm tussen de tekens. 

Zijn de tekens echter versprongen dan kan de tussenruimte afnemen tot 
0, 6 mm. De leeskop mag nooit twee komplete tekens op verschillende rec 










13 


De maximale hoogt e die de leeskop mag bestrijken vindt men uit 
0, 6 + 2 . 2, 39 + 0, 21 ( minimale streepdikte) 

Als men aanneemt dat een solarcel 0, 30 mm bestrijkt en de cellen zonder 
ruimte naast elkaar liggen is het maximaal toegelaten cellen in de lees- 

K°p 0( 3 0 1H - 
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4. QRGANISATIE VAN DE BESLISSER 

4. 0 Er wordt aangenomen dat de uitgangssignalen van de solarcellen voldoen 
versterkt zijn om een aantal trekkers te kunnen setten resp. resetten. 

De stand van een trekker zij M hoog M of n l n , indien de bijbehorende solar 
"zwart" vond en ,! laag n of M o M in de tegenovergestelde situatie. 

De beslisser zal uit de volgende onderdelen moeten bestaan: 

1* klokpuls generator van lMc 

2. schuifregister van 25 sekties 

3. start-schakeling, die aanwezigheid van 3 enen in het schuifregister 
detekteert. 

4. kolomteller 

5. 2 synchronisatieteUers 

6. aantal poorten om verticale strepen te detekteren 

7. aantal tellers om horizontale strepen te detekteren 

8. schakeling om aan de hand van de gevonden kenmerken het waargem 
teken te bepalen. 

4. 1 De klokpulsgenerator spreekt voor zich; de frequentie is noodzakelijk 
voor de gewenste leessnelheid. 

4.2 Dit schuifregister dient uit tenminste 5 sekties m€£r te bestaan dan er 
solarcellen zijn om het verliezen van informatie ten gevolge van het 
schuiven te voorkomen. 

In het schuifregister worden onder besturing van de startschakeling of d< 
kolomteller de gediskretiseerde uitgangssignalen van de solarcellen op- 
genomen. Dit schuifregister maakt vervolgens een aantal stappen. Dit kc 
overeen met het verschuiven van het teken naar boven of beneden. 

Het aantal schuif st^ppen wordt door de beide synchronisatieteUers (zie 
bepaald. 

4. 3 De startschakeling dient om de beslisser te doen beginnen. 

Aangenomen wordt dat de uitgangen der 25 versterkers via poorten op de 
setingangen van het register staan. Zodra de a-kolom van het teken onde 
de rij fotocellen komt, worden er tenminste drie sekties van het schuif¬ 
register geset* Door het plaatselijk ontbreken van inkt in het teken be- 

hoeven deze drie sekties niet naast elkaar te liggen. Wil men dit recht- 
streeks met binaire schekelingen detekteren, dan is hier zeer veel mate 

voor nodig: de gevraagde schakeling moet zonder noemenswaardige verti 

werken. Men kan echter op vrij eenvoudige wijze inktvlekken en lozeplek 



15. 


(plekken waar inkt plaatselijk ontbreekt) door een voorbewerking ver- 
wijderen. 

Hierbij wordt dan gebruik gemaakt van een meerderheidsbeslisser met 3 
ingangen. Hiermee kan men de uitgang van een solarcel vergelijken met 
de uitgangen van zijn buurcellen eventueel wijzigen. Er bestaan eenvoudig 
standaardschakelingen hiervoor. 

De schakeling is hieronder geschetst: 


i 



b‘ * j ( Q>,cj - O b qc + tc 

De werking van de voorgestelde koreektieschakeling kan alsvolgt verklaai 
worden: een nominate korte Streep met een lengte van 4 x de nominate 
streepdikte (bv. bij de 9 ) levert na verschuiving de volgende inhoud van h 
schuifregister: 

(1) 00111100-- (van links naar rechts= van bo\ 

naar beneden) 

Door het plaatselijk ontbreken van inkt of door inkt-spatjes zijn de volgen 
patronen ook mogelijk; 


( 2 ) 0 0 0 1 1 1 0 0 

(3) 0 0 10 110 0 

4 0 0 1 1 0 1.0 0 
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5. 0 0 1 1 1 0 0 0 

6 . 10 11110 0 

7. 0 111110 0 

8 . 0 0 111110 

9. 0 0 11110 1 

Het optreden van twee of meer storingen tegelijkertijd wordt niet be- 
schouwd. 

Na korrektie zien de signalen er als volgt uit: 

(1) 0 0 11110 0 

2 0 0 0 1 1 1 0 0 

3 0 0 0 1 1 1 0 0 

4 0 0 1 1 1 0 0 0 

5 0 0 1 1 1 0 0 0 

6 0 111110 0 

7 0 111110 0 

8 0 0 1 1 1 1 1 0 

9 0 0 1 1 1 1 1 0 

Nummert men de desekties van links naar rechts 1, 2, .. . 8, dan is de 
eis voor het herkennen van de korte streep: 

4. 5 (3+6) 

4. 4 KOLOMTELLER 

De kolomteller bepaalt welke der kolommen a t/m e momenteel door de 
rij fotocellen waargenomen wordt. Deze teller ontvangt zijn eerste puls ’ 
de startschakeling of van het voor de eerste .maal waarnemen van een ko 
streep. Vervolgens zou men de kolomteller elke 140 usee (nominale 
passeertijd van een kolom) een stap vooruit kunnen laten maken en de 
gediskretiseerde uitgangssignalen der solarcellen opnemen in het schuif- 
register. Vanwege de mogelijke variaties in de streep-dikte zal dit niet 
voldoen. In bijlage II is een mogelijke schakeling beschreven om de leesj 
op te wekken. 


ongewijzigd 

ongewijzigd 
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4. 5 T W££__SYNCHRQNISATIE TELLERS 

Er is reeds vermeld dat verschuiven van hettteken tot een korte vertik; 
streep of een vaste plaats gevonden wordt een goede methode is om de 1 
positie van het teken vast te leggen. Van elk der kolommen b t/m e di 
vervolgens de relatieve stand ten opzichte van kolom a vastgelegd te w 
Dit kan op twee manieren gebeuren. Ten eerste kan men het aantal schi 
pul sen tellen die noodzakelijk zijn om kolom a in de juiste stand te bre 
Dit aantal wordt vastgelegd . Vervolgens wordt elke kolom evenveel ve 
schoven . Ten tweede kan men eenschakeling toepassen als hieronder 
geschetst voor de le sektie van het register: 



De signalen tussen de aanhalingstekens geven de detektie signalen van 
tellerstanden aan. Zodra in de gewenste stand een korte verticale stre< 
wordt gevonden, wordt de teller geblokkeerd. Deze blokkering blijft, t< 
alle kolommen waargenomen zijn# Hierdoor is de juiste positie der kol< 
b t/m e direkt bekend. Tegenover deze tijdwinst staat de grote hoeve< 
heid benodigd materiaal:25 x 21 en-poorten met 2 ingangen en 2 of-poc 
met 25 ingangen. 

Als men een vergelijking wil treffen met de telefoontechniek, dan komt 
eerste methode overeen met een kiezer met ruststand en de tweede mel 
met een kiezer zonder ruststand. 

Gezien de benodigde hoeveelheid materiaal verdient de eerste methode 
voorkeur. De extra tijd die dit kost, (maximaal 21 usee per kolom) is z 
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Er is reeds gezegd dat het aantal schuifpulsen nodig voor de eerste 
verschuiving, geregistreerd moet worden. Dit kan door de stand van d< 
teller na het tot stilstand komen te ^egistreren in 5 trekkers. 

Een trekker is niet veel goedkoper dan een tweedeler. 

Men kan daarom eenvoudiger twee tellers nemen. Bij de teller het 
aantal schuifpulsen tijdens de verschuiving van de eerste kolom. 

Een der tellers wordt geblokkeerd op een korte Streep in de eerste 
kolom wordt gedetekteerd in bijv. de sekties 5 t/m 9. 

Een vergelijkingsschakeling in de yorm van een vijftal mod-2 optellerf 
tesamen beschouwd in een of-poort (voor elk bit dat de teHerstand aan- 
geeft een mod-2 opteller) reageert op het gelijk worden van de stand va 
de lopende teller en de geblokkeerde teller. Een hiervan afgeleide puls 
stopt de schuifwerking. Nadat de vijfde kolom is waargenomen en de 
daar voorkomende kenmerken zijn geregistreerd, resp. verwerkt, wor 
de geblokkeerde teller gereset. 

* 

4. 6 VERTICALS STREEPDETEjCTIE 

In par. 3. 2 is gesproken over enkele methode van herkenning. Een dire 
uitspraak over de optimale herkenningsmethode is niet te geven. Voor 
een commercieel apparaat is het voor de uiteindelijke kostprijs van grc 
invloed als er zo weinig mogelijk gebruik hoeft worden gemaakt van 
speciaal ontwikkelde schakelingen. Men kan veel goedkoper gebruik ma 
van standaard schakelingen al bevatten deze niet het minimum aantal 
onderdelen. Daar de uitgangssignalen van de solarcellen na versterking 
toch al gediskretiseerd worden voor de verticale plaatsbepaling is 
het voordelig de streepherkenning ook op binaire wijze plaats te doen 
vinden. Uit de figuren 1 eti 2 blijkt dat de nominale strepen vier & vijf 
maal de nominale streepdtkte lang zijn. Rekening houdend met mogelij! 
extra inktspatten en plaatselijk ontbreken van inkt, kan deze lengte 
variSren tussen de driemaal en zesmaal de nominale streepdikte. 

In par. 4. 3 is gevonden dat de eis voor detektie van een korte verticale 
streep luidde: 4.5 ( 3+6). 


* * i 
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Houdt men tevens rekening met een extra variatie van 1 streep- 
dikte tengevolge van lengtevariatie van de streep in de eerste kolom 
( waar immers op gesynchroniseerd wordt) dan komt men tot een eis van 
drie uit zes, waarbij tenminste 2 "enen” naast elkaar voorkomen. 

Met behulp van de reeds genoemde twee uit drie schakelingen en een aanta 
gewone poorten kan men een drie uit zes schakeling maken met de genoem 
beperking. Deze schakeling is hieronder aangegeven. De zes sekties zijn 
aangegeven met A*B» C, D, E, F. Bij deze schets is geen rekening ge- 
houden met de inver.terende werking van de transistoren in de poortscha- 
kelingen. 



Daar de verticale strepen zich op drie virschillende hoogten kunnen bevin< 
diesnt men de bovenstaande schakeling driemaal uit te voeren. Eventueel 
kan men van deze schakelingen gebruik maken voor de start schakeling ( zi 
par. 4. 3). 

4. 7 HORIZON TAPE STREEPDETEKT1E 

Ook de horizontale strepen zullen met binaire schakelingen bepaald worde 
In tegenstelling tot de verticale strepen zijn bij de horizontale strepen de 
noodzakelijke zwarte velden niet op hetzelfde moment bekend * 
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Dit maakt een geheugenschakeling nodig. De eenvoudigste methode is het aan* 
tale enen te tellen dat achtereenvolgens te vinden is in een sektie van het schi 
register. Overschrijdt dit aantal een van tevoren bepaald totaal (bijv. 3) 
dan wordt de aanwezigheid van een horizontale streep vastgesteld. Deze telle 
kunnen zelfblokkerend worden uitgevoerd. Tengevolge van de mogelijke varia 
van + streepdikte dienen er voor elke mogelijke positie van een horizonl 

streep drie tellers aangebracht te worden. Daar de horizontale strepen vier 
mogelijke nominate posities heeft zijn er twaalf tellers nodig. Slechts als me 
drukwerk zonder noerxienswaardige inktspatten kan verwachten of als deze sp< 
met een voorbewerking geelimineerd zijn ( zie par. 4. 3) kan men volstaan mi 
teller per nominale positie. Deze teller wordt dan bestuurd door een of- 
schakeling waarop de uitgangen van de drie sekties staan waar de streep Ian] 
schuift. 


4.8 TEKENBESLISSER 

Zijn de kenmerken alle waargenomen dan dient beslist te worden welk teken 
gelezen is. Qok hier zijn twee verschillende mogelijkheden. 

Uitgaande van de diverse waarheidstabellen komt men tot een schakeling , 
bestaande uit 13 en-poorten met ieder evenveel ingangen als er zinvolle ken 
merken zijn, plus een of-poort waarmee het laag zijn van alle 13 en-poorten 
is waar te nemen. In dat geval is er geen enkel teken herkend. Hierbij is het 
uitgesloten dat meer dan een en-poort hoog is. Wil men lierkennen volgens de 
methode dan dienen alle kenmerken simultaan bekend te zijn : Er is een gehe 
nodig en wel voor de kenmerken die tijdens het waarnemen van de kolommen 
a t/m d bepaald worden. Dit zijn 4x3 = 12 kenmerken. Het geheugen dient < 
12 trekkers te bevatten met de nodige set-poorten. 

Gaat men van een ander idee uit voor de tekenherkenning dan is dit geheugen 
het geheel niet nodig. Vindt men immers in de kolommen a t/m d een bepaalc 
kenmerk dan kan men direkt zeggen welke tekens eventueel mogelijk zijn en 
welke zeker niet. Men kan deze kennis alsvolgt benutten: zodra in de eerste 
kolom het kenmerk al of a2 (afhankelijk van de schuifrichting) gevonden wor 
worden 13 tekentrekkers geset. Vervolgens wordt bij het al of niet optreden \ 
de afzonderlijke kenmerken die trekkers gereset, waarvan het bijbehorende t 
zeker niet meer mogelijk is. Per kenmerk zijn er tei^ee poorten nodig, voor 
19 kenmerken kost dit dan 38 of-poorten. Elke trekker krijgt een reset of-po 
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met 19 ingangen # Deze aantallen zijri riiet geheel juist, daar slechts zinvoll< 
kenmerken beschouwd hoeven te worden. Een zinvol kenmerk is een kenmerl 
dat kenmerkend is voor een teken en dat niet ontbreekt noch aanwezig is bij 
alle tekens. Zo is kenmerk a2 ( bij naar beneden schuiven) niet zinvol, daar 
alle tekens dit kenmerk bezitten. Evenzo is kenmerk b2 niet zinvol daar eeei 
enkel teken dit kenmerk bezit, Uit tabel III ( resp, V) blijkt dat het aantal 
zinvolle kenmerken 13 ( resp. 14) is. Volgens beide methoden is de uitgang 
van de herkenner gedurende de tijd nadat de vijfde kolom is waargenomen en 
onderzocht totdat van een volgend teken de eerste kolom is waargenomen en 
onderzocht beschikbaar voor het uitlezen van het resultant. Is deze tijd 
te kort dan dienmbv. een extra 13 trekkers als buffergeheugen aangebracht 
te worden. 
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5. 1 REDUNDANTIE REDUKTIE 


In bijlage 1 is een methode afgeleid om de brtrouwbaarheid van het 

leesysteem te onderzoeken. Hierbij is uitgegaan van de veronder stellin; 

dat alle zinvolle kenmerken benut worden. Nu zijn niet al deze kenmerk 

even belangrijk dwz. het elimineren van kenmerk i zal niet dezelfde toe 

van de verwachte substitutie fout opleveren als het elimineren van 

kenmerk j ( i ongelijk j). Het ligt dus voor de hand aan elk kenmerk een 

waardering toe te kennen die evenredig is met de verwachtfe toename 

van de substitutiekans indien het betreffende kenmerk geelimineerd wpr< 

Hiertoe bepaald men de onderlinge afstanden d x ( i, j ) der tekens 

k 

na eliminatie van kenmerk x^_ . 

Dan geldt volgens bijlage I : 
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Hierin is: 

A P ( x ^) toename van de substitutiefout als kenmerk x^ geelimineerd 
wordt. 

p de kans op het verkeerd waarnemen van kenmerk 

d x ( i, j ) de onderlinge Hammingkfstand tussen de tekens i en j 

d_ (i, j) de onderlinge Hammingafstand tussen de tekens i en j als kenm 
k 

Xj_ geelimineerd wordt. 


Bij een zinvolle redundatie reduktie elimineert men dat kenmerk x^ was 
voor A p ( x^) minimaal is, De keuze van x^ zal in het algemeen afhankeJ 
zijn van p. Het zou verkeerd zijn te menee dat het kenmerk x m dat na 
x-^ de kleinste Ap ( x^) opleverde vervolgens als eerste in aanmerking ko 
voor eliminatie. De gevonden (x^) ( k / 1) zijn immers berekend in <] 

veronderstelling dat kenmerk x^ ook beschouwd werd . Daar is na elimin 
van x-^ niet meer aan voldaan. Men dient de gehele procedure weer te he 
halen dwz. uitgaande van 12 kenmerken wordt steeds van deze kenme 
niet beschoud. Dit levert 12 verschiilende A P (x De Ideinste A p(x )geef 

k ' K 

weer aan welk kenmerk geelimineerd kan worden. 

Men kan zo doorgaan met kenmerkend te elimineren totdat de berekende 
of experimenteel bepaalde substitutiekans een maximaal toegelaten waar< 
bereikt. 
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Het is echter zeer de vraag of men er verstandig aan doet over te gaan 
tot redundantie reduktie. Zoals gebleken is bij de behandeling van de 
organisatie van de beslisser krijgt men sommige kenmerken praktisch 
cadeau. Er is dan slechts 64n en-poort met twee ingangen per kenme rk 
nodig. De eventuele be sparing die te bereiken zijn met de redundantie 
reduktie wegen dan niet op tegen de verwachte verhoging van de substi¬ 
tute kans en de lcosten verbonden aan de berekeningen van deze redukth 
De zojuist beschreven methode om redundantie reduktie te verkrijgen is 
te omslachtig . Men weet immers a priori dat het voor een betrouwbaai 
leessysteem noodzakelijk is dat de kans op het verkeerd interpreteren x 
een kenmerk kleiner is dan 10" . Dan mogen formules ( 7 ) en (8) uit 
bijlage I gebruikt worden. Hieraan ziet men dat de substitutiekans niet 
beinvloed zal worden door een reduktie waarbij de minimale afstand gel 
blijft de relatieve frequentie van d ^ de gewijzigde afstands- 
tabel niet verandert. Anders gezegd: vermindering van een afstand 4 tc 
heeft geen invloed maar de vermindering van een afstand 3 tot 2 vergroi 

de substitutiekans met n + 1 . als n het aantal keren is dat d . in de 

~ mm 

beschouwde tabel voorkomt (zie formule 6). 

De werkwijze is dan alsdus: noteer de parentekens die een afstand 2 of 
hebben. De kenmerken die hierbij een rol spelen worden essentieel gen< 

«* m 

Elk ander paar moet verschillen. in minstens drie essentiele kenmerken 
Is dit niet het geval dari dienen er essentiele kenmerken toegevoegd te v 
tot aan bovengenoemde eis voldaan is* Past men deze methode toe op ta 
V en VI dan blijken slechts de kenmerken cl en fl niet essentieel te zijr 
Deze kunnen dus geelimineerd worden zonder dat de verwachte substitul 
kans noemenswaardig vergroot wordt# 

De essentiele kenmerken zijn in dit geval a3, bl, c2, c3, dl, d2, el, < 
e3, f2, f3, en £4. 



VERMINDERING VAN HET AFWIJZINGSPERCENTAGE 


Zoals in bijlage I is afgeleid kan men de substitutiekans van twee tekens 
verkleinen door hun onderlinge afstand te vergroten. 

Dit kan geschieden door meer kenmerken te gaan beschouwen. 

De toegevoegde kenmerken zijn verschillend voor beide tekens. Hierbij 
vergroot men echter de afwijzingskans. Als een teken gedefinieerd wordt 
door x kenmerken waarvan de kans op verkeerde interpretatie p is, is de 
afwijzingskans p a gegeven door: 

p a = - ( a) -*- ( 3) p 3 ^ + 

Daar p a kleiner moet zijn dan 7. ld^ en x ongeveer 10 is, kan dit benadercf 
worden door: 

Pa > = P.x 

-q . -S 

St el p fr f 1° e ia x =1 1 O dcno »S : P ^ 7 1 ° 

'a 

De afwijzingskans kan men kleiner maken door minder kenmerken in be- 
schouwing te nemen. 

Hiertegenover staat dat om de substitutiekans zo laag mogelijk te houden 
de onderlinge afstanden tenminste twee en zo mogelijk drie moeten zijn. U: 
de essentiele kenmerken kiest mnkn voor elk teken een aantal noodzakelijke. 
Om de noodzakelijke kenmerken voor het teken 0 te vinden zoekt men in 
Tabel VI eerst de tekens met afstand 2 of 3 tot de n 0 M . Dit zijn de M 2 M , n 3 n 
en M 9 , b De kenmerken waarin de f, 0 n verschilt van de n 2 n , U 3 M en n 9 n zijn 
in ieder geval noodzakelijk. Dit zijn de kenmerken a3, e2, e3, f3 en f4. Nu 
gaan we na of de afstanden tot de overige tekens voldoende zijn. Is dit niet 
het geval dan noteren we hoeveel kenmerken nodig zijn en uit welke essentn 
kenmerken deze gekozen mogen worden. De genoemde kenmerken a3, e2, e 
f3 en f4 blijken voldoende te zijn om het teken !1 0 n te onderscheiden van de 
andere tekens, behalve van de 11 hook 11 : 

Om dit te verhelpen zal van de kenmerken c2 en c3 als noodzakelijk 

voor de r, 0 ff moeten worden aangemerkt. 

Vervolgens wordt de proced£ herhaald voor alle volgende 12 tekens. 

Hierbij moet er wel opgelet worden dat bij het bepalen van de noodzakelijke 
kenmerken voor teken i men voor de Hammingafstand van teken i tot teken ; 




(j 4i) alleen rekening houdt met de noodzakelijke kenmerken van j. 

Alle andere kenmerken zijn voor het teken j immers M don ! t care" 
voorwaarden geworden. 

Daar deze wijze om de noodzakelijke kenmerken van elk teken te bepa 
resultaten zal opleveren die afhankelijk zijn van de volgorde van de 
beschouwde tekens bij dit iteratie proces zal het resultaat in het alger 
niet optimaal zijn. Gezien de gedaante van dit vraagstuk is het optima! 
resultaat waarschijnlijk te vjjnden met behulp van lineaire programme 


CONCLUSEE 

Een optisclu leesapparaat voor gestyleerde tekens van het n Class A M 
type kan op een vrij eenvoudige wijze worden gerealiseerd. Niet- 
ideaal gedrukte tekens kunnen betrouwbaar genoeg worden gelezen om 
toepassingen in het bank-en girowezen mogelijk te maken. 


Gaarne wil ik hier mijn dank betuigen aan de Internationale Bedrijfs- 
machine Maatschappij N. V. voor de leerzame stage die ik op haar 
Ontwikkelingslaboratorium te Uithoorn heb mogen maken. 

Veel ben ik verschuldigd aan haar medewerkers de heren A. de Boer, 
H. van Steenis en S. van Straten.en aan mejuffrouw A* M. Schoonwater 
voor de typografische verzorging van dit verslag^ 
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BIJLiAGE I 


Afleiding van kwalitatieve vergelijkingsformules. 


Aangenomen wordt dat de kans p op verkeerde waarneming voor alle 
kenmerken even groot is, dat alle tekens even frequent voorkomen 
en dat alle substitutiefouten dezelfde kosten met zich mee brengen. 
Tekens A en B hebben een Hammingafstand d ( AB) dwz. zij verschillei 
in d (A B) kenmerken . De kans op een substitutie van A voor B of van 
B voor A onder de voorwaarde dat teken B resp. A waargenomen dient 
te worden is : 


p (AB) = p d ( AB ) 



De kans p su ^ gt op een willekeurige substitutie onder overeenkomstige 
voorwaarden is : 


P 

Subs t. 





J - 


P 


( 2 ) 


De konstante is noodzakelijk om de conditionele substitutiekans 

p su ] 3St de waarde 1 te laten bereiken voor de waarde 1 van p. 

Er kan een gewogen gemiddelde afstand worden gedefinieerd als zijnde 
d^em = d(i, j) voor alle i en j die, gesubstitueerd in (2) dezelfde substit 
kans oplevert. 




\ 2 > 
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^ l s o' ) 
p 


d 







P 


7? 


(3) 




Deze gewogen gemiddelde afstand kan gezien worden als een aanduiding 
voor de betrouwbaarheid van het herkenningssysteem bij een gegeven kar. 
p op verkeerde waarneming van 66n kenmerk. Hoe groter deze afstand i 
des te betrouwbaarder is het systeem. 

De waarde van p is niet a priori bekend. Om toch diverse methoden te ve 
gelijken wordt de minimale p su ^ s ^- a ^ s functie van p bepaald* Dit wordt g 
demonstreerd aan de hand van een voorbeeld. 

In het geval van herkenning van Class A tekens volgens de kenmerk methc 
met vetticale centrering door verschuiving dient men te bepalen welke 
schuifrichting de voorkeur verdient. Hiertoe wordt het verschil der ver- 
wachte substitutie fouten bepaald: 


A p 


Su bs+. 


P 


Su. bs+. 


C1) 


p 




C3EJ 


(4 

Is A P 5i( J> o dan verdient methode II de vborkeur. Methode I zij centrering 
volgens verschuiving naar beneden, methode II is de methode waarbij 
naar boven geschoven wordt. 

Tabellen IV en VI leveren : 


A P 




_L ( p J - E P 4, 

72 



(5 


Deze furxrtie is positief voor kleine p . Daar voor grotere p geen betrouv 
baar lees systeem is te ontwerpen is methode II te verkiezen boven method* 
Voor een bruikbaar leesyysteem zal de substitutiekans in de buurt van de 
5. 10 tot 1. 10~ 6 moeten liggen. In figuur 5 is het verband tussen p 
(de kans op het verkeerd waarnemen van een kenmerk) en de substitutie¬ 
kans uitgezet. De kurve (a) geeft dit verband bij naar beneden geschoven 
tekens ( volgens tabel IV) . De kurve (b) geeft de verwachte substitutie¬ 
kans als het teken naar boven geschoven wordt. ( volgens tabel VI). 

Voor p £ 10“* kan formule ( 2) zeer goed benaderd worden door : 


SUb5+. 


n 

*8 


oJ 


- o 


F> 


( 6 ) 


r 
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Waarbii n de relatieve frequentie van de minimale afstand in 
78 

tabel IV resp. VI aanduidt. n is het aantal afstanden dat gelijk is aan 
deze minimale afstand. 

De numerieke waarden zijn : 


(a) 


» = 3 

subst 7HT 


(7) 


(b) 


subst 


-L P : 

7 8 


(8) 


i r 


I 
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BIJLAGE II 

Bepaling van de afstand tussen de kolommen 

De nominale streepdikte is 0, 014 inch. Bij een snelheid van 100 inch per 
sekonde komt dit overeen met een tijd van 140 usee. Nu kan de streepdikte 
variSren tussen de 0.008 n en 0. 020 M . De overeenkomstige tijden zijn dan 
resp. 80 en 200 usee. De tolerantie tussen de afstanden der middens van de 
strepen is echter vrij klein, namelijk 0. 003 n of wel 30 usee. Kan men het 
midden van een puls bepalen, die uit de waarnemer komt, dan weet men dat na 
(140 + 30) usee de volgende kolom waargenomen kan worden. Gevraagd wordt ee 
schakeling, die op het in de figuur aangegeven moment een leespuls opwekt. 


Ho-x 


h 




IWo (USCC- 


Dit kan gerealiseerd worden met een teller, die gestart wordt op het moment t=0 

dus door de puls uit de solarcel. Deze teller loopt door tot het moment 140 + x. 

Deze tijd wordt onderscheiden in de pulsduur 2x en de wachttijd 140-x;Indien de 

teller de puls van 2 x usee, ziet als een puls van x usee, dan telt de teller een 

(konstant) aantal pulsen, namelijk + 140-x = 140. 

c* 

Dit kan bereikt worden door v<5<5r de teller een tweedeler te plaatsen. Zolang er 
een hoog signaal uit de solarcel komt, wordt de klokpulsfrequentie gehalveerd. 
Zodra het hoge signaal wegvalt, wordt de klokpuls rechtstreeks naar de teller 
geleid. De klokpulsfrequentie wordt naar beneden begrensd door de gewenste nau\ 
keurigheid en naar boven door de optredende vertragingen. De schakeHng werkt o 
voor asymmetrische pulsen (zie figuur), mits alle signalen ten naaste bij dezelfde 
vorm hebben. Het midden der pulsen is dan wel absoluut, doch niet relatief fout. 


DC | ^ 

—t 

A — ~ _t ; 

/ i i 

i i 

i ' 

! 1 

sestaan circuits (13) die het moment bepalen,waarop een signaal zijn maximale 


Er 

waarde bereikt. In feite wordt niet het gewenste maximum gedetekteerd, doch het 
moment waarop de afgeleide negatief wordt. Bij een signaal als hieronder ge- 
schetst, kan dit moeilijkheden opleveren. 
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Moment tj wordt gedetekteerd, in plaats van het gewenste moment 
t m of het wellicht juistere moment t^- 







